环境准备
JDK: Spark 2.2.0及以上版本只支持JDK1.8
Maven:3.3.9
设置maven环境变量时,需设置maven内存:
export MAVEN_OPTS=”-Xmx2g -XX:ReservedCodeCacheSize=512m”
Scala:2.11.8
Git
编译
下载spark的tar包,并解压
1 | [hadoop@hadoop000 source]$ wget https://d3kbcqa49mib13.cloudfront.net/spark-2.2.0.tgz |
编辑dev/make-distribution.sh
1 | [hadoop@hadoop000 spark-2.2.0]$ vi dev/make-distribution.sh |
添加以下内容:
1 | VERSION=2.2.0 |
编辑pom.xml
1 | [hadoop@hadoop000 spark-2.2.0]$ vi pom.xml |
安装
1 | [hadoop@hadoop000 spark-2.2.0]$ ./dev/make-distribution.sh --name 2.6.0-cdh5.7.0 --tgz -Dhadoop.version=2.6.0-cdh5.7.0 -Phadoop-2.6 -Phive -Phive-thriftserver -Pyarn |
稍微等待几小时,网络较好的话,非常快。
也可以参考J哥博客:
基于CentOS6.4环境编译Spark-2.1.0源码 http://blog.itpub.net/30089851/viewspace-2140779/